FakeQuantWithMinMaxVarsPerChannel ================================= 对输入数据执行按通道(Per-Channel)的逐元素伪量化运算。该算子将输入数据划分为 ``channel_num`` 个等长的通道,每个通道根据其对应的最小/最大值(min_val[c] / max_val[c])独立计算缩放因子和零点,进行模拟量化与反量化。 .. math:: channel\_size = \frac{length}{channel\_num} .. math:: \text{对于通道 } c: \quad scale_c = \frac{max\_val_c - min\_val_c}{quant\_max - quant\_min} .. math:: output_{c,i} = \text{FakeQuant}(input_{c,i}, scale_c, nudge\_min_c) 输入: - **src** - 输入数据地址。 - **min_val** - 每个通道最小值组成的数组地址。 - **max_val** - 每个通道最大值组成的数组地址。 - **length** - 输入数据总长度(需能被通道数整除)。 - **quant_min** - 量化后的整数最小值。 - **quant_max** - 量化后的整数最大值。 - **symmetric** - 是否使用对称量化。 - **channel_num** - 通道数量。 - **core_mask(int, 可选)** - 核掩码(仅适用于共享存储版本)。 输出: - **output** - 伪量化后的计算结果地址。 支持平台: ``FT78NE`` ``MT7004`` .. note:: - FT78NE 支持:fp32 (fp) - MT7004 支持:fp16 (hp), fp32 (fp) - 输入数据的总长度 ``length`` 必须可以被 ``channel_num`` 整除。 - 每个通道的逻辑(包括 Nudge 零点调整)与单变量版本的伪量化一致。 **共享存储版本:** .. c:function:: void fp_fake_quant_with_min_max_vars_per_channel_s(float* src, float* min_val, float* max_val, float* output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask) .. c:function:: void hp_fake_quant_with_min_max_vars_per_channel_s(half* src, half* min_val, half* max_val, half* output, int length, int quant_min, int quant_max, bool symmetric, int channel_num, int core_mask) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 15 // FT78NE 示例:fp32 类型共享存储多核计算 #include #include #include "78NE/utils.h" int main(int argc, char* argv[]) { float *input = (float *)0xA0000000; float *min_arr = (float *)0xA1000000; float *max_arr = (float *)0xA1001000; float *output = (float *)0xB0000000; int length = 960000; int channel_num = 100; int core_mask = 0b1011; fp_fake_quant_with_min_max_vars_per_channel_s(input, min_arr, max_arr, output, length, 0, 255, false, channel_num, core_mask); return 0; } **私有存储版本:** .. c:function:: void fp_fake_quant_with_min_max_vars_per_channel_p(float* src, float* min_val, float* max_val, float* output, int length, int quant_min, int quant_max, bool symmetric, int channel_num) .. c:function:: void hp_fake_quant_with_min_max_vars_per_channel_p(half* src, half* min_val, half* max_val, half* output, int length, int quant_min, int quant_max, bool symmetric, int channel_num) **C调用示例:** .. code-block:: c :linenos: :emphasize-lines: 14 // MT7004 示例:fp16 (half) 类型私有存储单核计算 #include #include int main(int argc, char* argv[]) { half *input = (half *)0x10000000; half *min_arr = (half *)0x10008000; half *max_arr = (half *)0x10008100; half *output = (half *)0x10009000; int length = 2000; int channel_num = 10; hp_fake_quant_with_min_max_vars_per_channel_p(input, min_arr, max_arr, output, length, 0, 255, true, channel_num); return 0; }